Upcoming astronomical surveys will observe billions of galaxies across cosmic time, providing a unique opportunity to map the many pathways of galaxy assembly to an incredibly high resolution. However, the huge amount of data also poses an immediate computational challenge: current tools for inferring parameters from the light of galaxies take $\gtrsim 10$ hours per fit. This is prohibitively expensive. Simulation-based Inference (SBI) is a promising solution. However, it requires simulated data with identical characteristics to the observed data, whereas real astronomical surveys are often highly heterogeneous, with missing observations and variable uncertainties determined by sky and telescope conditions. Here we present a Monte Carlo technique for treating out-of-distribution measurement errors and missing data using standard SBI tools. We show that out-of-distribution measurement errors can be approximated by using standard SBI evaluations, and that missing data can be marginalized over using SBI evaluations over nearby data realizations in the training set. While these techniques slow the inference process from $\sim 1$ sec to $\sim 1.5$ min per object, this is still significantly faster than standard approaches while also dramatically expanding the applicability of SBI. This expanded regime has broad implications for future applications to astronomical surveys.
translated by 谷歌翻译
学习在无人驾驶汽车(UAV)捕获的图像中检测物体(例如人类)通常会遭受无人机对物体的位置造成的巨大变化。此外,现有的基于无人机的基准数据集不提供足够的数据集元数据,这对于精确的模型诊断至关重要,并且学习功能不变。在本文中,我们介绍了大天使,这是第一个基于无人机的对象检测数据集,该数据集由具有相似想象条件以及无人机位置以及对象姿势元数据捕获的真实和合成子集组成。一系列实验经过精心设计,使用最先进的对象检测器设计,以证明在模型评估过程中利用元数据的好处。此外,还提供了几种涉及模型微调过程中涉及真实和合成数据的关键见解。最后,我们讨论了有关大天使的优势,局限性和未来方向,以突出其对更广泛的机器学习社区的独特价值。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
虽然行星系统的引力微透镜可以在外部片网的性质上提供独特的vistas,但是通常可以用多种和不同的物理配置来解释这种2体微透镜事件的观察,所谓的模型退化。对不同类别退化的内在和外源性起源的理解为现象学解释提供了基础。在这里,利用基于快速的机器学习推断框架,我们展示了一种新的退化制度 - 偏移退化 - 统一的级别已知的级别和内外的退化,概括为共振焦化,以及重新分析,在先前公布的行星事件中普遍存在2倍的退化溶液中。重要的是,我们的发现表明,通常报告的级别逐步退化基本上从未出现在实际事件中,而是应该更适当地被视为偏移退行病的过渡点。虽然以前的微溶剂变性的研究在很大程度上研究了脱腐蚀性,但我们的发现表明脱腐蚀性不一定导致退化的事件,这对于后者在源地点的研究放大率更为相关。这一发现从根本上改变了应该解释行星微透镜事件中的退化过程的方式,表明2人镜头的数学中的更深对称性,而不是先前认识到,并且将越来越多地表现出来自新几代微溶剂调查的数据。
translated by 谷歌翻译
具有多级连接的深度神经网络,以复杂的方式进程输入数据来了解信息。网络学习效率不仅取决于复杂的神经网络架构,还取决于输入训练图像。具有用于头骨剥离或肿瘤的深神经网络的Medical图像分段。来自磁共振图像的分割使得能够学习图像的全局和局部特征。虽然收集在受控环境中的医学图像,但可能存在导致输入集中固有偏差的伪影或基于设备的方差。在本研究中,我们调查了具有神经网络分割精度的MR图像的图像质量指标的相关性。我们使用了3D DenSenet架构,并让网络在相同的输入上培训,但应用不同的方法来基于IQM值选择训练数据集。基于随机训练的模型之间的分割精度的差异基于IQM的训练输入揭示了图像质量指标对分割精度的作用。通过运行图像质量指标来选择培训输入,进一步调整网络的学习效率和分割精度。
translated by 谷歌翻译
什么是学习? 20美元^ {st} Centure的学习理论形式化 - 这是人工智能中沉淀的革命 - 主要是在$ \ mathit {in-diversion} $学习,即在假设训练数据被取样的假设下学习与评估分布相同的分配。这种假设使这些理论不足以表征21美元^ $ {st} MENTURE的现实世界数据问题,其通常是通过与培训数据分布(称为公共学习)不同的评估分布来表征。因此,我们通过放松这种假设来对现有可读性的正式定义进行小小的变化。然后,我们介绍$ \ MATHBF {学习\效率} $(LE)来量化学习者能够利用给定问题的数据的金额,无论它是一个或分发的问题如何。然后,我们定义并证明了可读性的广义概念之间的关系,并展示了该框架是如何足够一般的,以表征传输,多任务,元,持续和终身学习。我们希望本统一有助于弥合现实世界问题的实证实践与理论指导之间的差距。最后,因为生物学学习继续胜过机器学习算法的某些挑战,我们讨论了这一框架VI的局限性 - \'A-is-is-is-is-is-is-is-vis,它的形式化生物学学习能力,旨在为未来研究的多个途径。
translated by 谷歌翻译
当前的量子点(QD)设备的自动传动方法在显示出一些成功的同时,缺乏对数据可靠性的评估。当自主系统处理嘈杂或低质量数据时,这会导致意外的失败。在这项工作中,我们为QD设备的强大自动调整提供了一个框架,该QD设备将机器学习(ML)状态分类器与数据质量控制模块结合在一起。数据质量控制模块充当“守门人”系统,确保只有国家分类器处理可靠的数据。较低的数据质量会导致设备重新校准或终止。为了训练两个ML系统,我们通过结合QD实验的典型合成噪声来增强QD仿真。我们确认,在状态分类器的训练中包含合成噪声可以显着提高性能,在测试实验数据时,准确性为95.0(9)%。然后,我们通过表明状态分类器的性能随着预期的数据质量而恶化,从而验证数据质量控制模块的功能。我们的结果为嘈杂的QD设备的自动调整建立了强大而灵活的ML框架。
translated by 谷歌翻译
许多生物,包括各种种类的蜘蛛和毛毛虫,都会改变其形状以切换步态并适应不同的环境。从可拉伸电路到高度变形的软机器人,最近的技术进步已经开始使变化的机器人成为可能。但是,目前尚不清楚应如何以及何时发生变化以及可以获得哪些功能,从而导致各种未解决的设计和控制问题。为了开始解决这些问题,我们在这里模拟,设计和构建一个软机器人,该机器人利用形状变化来在平坦和倾斜的表面上实现运动。在模拟中对该机器人进行建模,我们在两个环境中探索了它的功能,并证明了特定于环境特定形状和步态的存在,这些形状和步态成功地转移到了物理硬件中。我们发现,改变形状的机器人在模拟和现实中比等效但不正确的机器人更好地遍历这些环境。
translated by 谷歌翻译
学习排名 - 制作特定于查询的项目的排名列表以及一组监督项目 - 是一个普遍兴趣的问题。我们认为的设置是没有分析描述构成良好排名的设置。取而代之的是,我们有一个包含(目标项目,有趣的项目集)对的表示和监督信息的集合。我们在仿真中进行了分析证明,在实际数据示例中,当监督与“这几个相似的项目相似”时,通过使用整数线性程序组合表示来进行排名是有效的。尽管这项提名任务是相当普遍的,但对于特异性,我们从图表中的顶点提名的角度介绍了我们的方法论。本文描述的方法是模型不可知论。
translated by 谷歌翻译
Despite progress in perceptual tasks such as image classification, computers still perform poorly on cognitive tasks such as image description and question answering. Cognition is core to tasks that involve not just recognizing, but reasoning about our visual world. However, models used to tackle the rich content in images for cognitive tasks are still being trained using the same datasets designed for perceptual tasks. To achieve success at cognitive tasks, models need to understand the interactions and relationships between objects in
translated by 谷歌翻译